ОПТИМИЗАЦИЯ КОНТУРА ТЕЛЕНАВЕДЕНИЯ С УЧЕТОМ ОГРАНИЧЕНИЯ УПРАВЛЕНИЯ
3.1. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ С УЧЕТОМ ИНТЕГРАЛЬНОГО ОГРАНИЧЕНИЯ
Рассмотрим задачу управления линейным объектом
‘-g — = i4* + J? n+& x(t0)=x0, (3.1)
где х, и, | — векторы размерности (nXl), (гX1) и (пХ1) соответственно; А и В — зависящие от времени матрицы (пХп) и (пХг); ЛЩ(0]=0,
A*U(WW]=*«(*i. (3.2)
где5(^) —матрица (лХл).
В системе телеуправления уравнение (3.1) описывает автономный контур и уравнение связи, |(^)—ошибки передачи команд и возмущения, действующие на наводящийся объект.
Управление u(t) осуществляется на основе наблюдений вектора z(t) размерности (/X1)
zit)=C(t)’x(t)+n(t), (3.3)
где С — переменная матрица (/Хл), М[«(/)]=0,
М [п &) и* (*,)]=N (/J 8 (t, — *,). (3.4)
Предположим также, что х0, n(t) и %(t) независимы и подчиняются нормальному закону распределения.
Управление u(t) будем считать оптимальным, если оно минимизирует функционал
/*=ЩхТЮРх(Ц]
и удовлетворяет ограничению
Здесь Р—положительная матрица (пХп), a д(і)—положительно-определенная матрица (ґХг).
Применим для определения управления метод стохастического принципа максимума, изложенный в гл. II.
Постоянная величина фп+2 равна нулю, если оптимальное управление удовлетворяет условию (3.6) со знаком строгого неравенства, и фп+г^О, если определенное при ^„+2=0 управление не удовлетворяет (3.6). В последнем случае г|)п+2 определяется из условия (3.6) со знаком равенства.
Согласно выражению (2.33)
_ А*Ш *(У= -2Р{К) x{tu). (3. 8)
at
Решение этого уравнения
<Ht)=-2KT(tB, t)P(tB)x(Q, (3.9)
где K(tB, t)—матрица импульсных переходных функций уравнения (3.1):
dK(t г) т); т) = £# (3.10)
at
Здесь Е — единичная матрица (пХп).
Управление u(t), максимизирующее условное математическое ожидание от уравнения (2.47), может быть определено из условия:
(3.11)
поскольку область определения u(t) не ограничена. Так как управление является функцией наблюдений «=«(*;*, t), то оно является неслучайным по отноше-
нию к математическому ожиданию в выражении Выполняя дифференцирование, получим
|
|
|
|
|
|
где Q~l(t) — матрица, обратная q(t).
Из уравнения (3.12) следует, что оптимальное управление, минимизирующее функционал (3.5), пропорционально в каждый момент времени оценке значения координат в конечный момент управления на основе наблюдений до момента t реализации вектора z(t).
Воспользовавшись уравнением (3.1), мы можем выразить оценку конечного значения фазовой координаты *(^в) через оценку ее текущего значения x(t).
Используя определение матрицы импульсных переходных функций K(tB, t) из уравнения (3.10), запишем
‘в
*(*,)=*(*„, *)*(*)+[*(/„, т)[9я(т)+$т)]Л. (3. 13)
t
Применяя к обеим частям этого равенства оператор условного математического ожидания и учитывая, что
М 0(*) 1^*1 = 0, %>t (3.14)
м[й(т)ІгУ=<?(С *)м[r(OI*!;]; т>*> (3-15)
где обозначено
G{i„ т) = -^W-BriFfr, r)P(tB), (3. 16)
получим
М [х (О I г;] =g~* (Ів, t) к (tB, t) M [x (і) I vj. (3.17) Здесь g~x(tB, /) — матрица, обратная g(tB, t):
g[tB, t)=E.~ j K(t„ t t) dx. (3.18)
t
Подставляя выражение (3.15) в уравнение (3.12) и учитывая соотношение (3.16), получим’ окончательно
Таким образом, управление в каждый момент времени пропорционально оценке текущих фазовых координат объекта.
Постоянная фп+2<С0 определяется из условия (3.6), взятого со знаком равенства.
Пример 3.1. Пусть объект управления описывается системой уравнений
= И + С*, Xi (*о) = Xiq)
dx 2
— =xh x2(t0) = x20.
Рассматриваемый случай соответствует контуру телеуправления, в котором автономный контур принят безынерционным, а уравнение связи является двойным интегрирующим звеном (см. 1.4).
Управление осуществляется на основе измерения линейного отклонения х2:
г = х2 (0 + п it)
В качестве критерия точности примем средний квадрат пролета в момент встречи
R (tB) = х2 (tB) + Axi (tB), A = const >0 (3.21)
и в функционале (3.5) матрица будет иметь вид
Д2 А
А 1
В качестве ограничения рассмотрим математическое ожидание интеграла от квадрата управления, что эквивалентно £>=1 в (3.6). Определим оптимальный закон управления u(t).
В рассматриваемом случае п=2, r= 1, /= 1.
Из соотношения (3.16) G(tBt t) является вектором-строкой и равна
|
|
||
|
|||
где D = 1 — ОцД — Ct2i = 1 — “ [Ов — І + Д)3 — Д3]-
Подставляя полученные выражения в уравнение (3. 19) и перемножая матрицы, получим
В (О = <В ‘ {^в — і + Д) М [xi (0/^*] + М [х2 (0/4J •
(3.28)
При А=0, что соответствует требованию минимума среднего квадрата линейного рассогласования в момент встречи, получим закон управления в виде
= (3.29)